智能论文笔记

Text and author-level political inference using heterogeneous knowledge representations

Samuel Caetano da Silva , Ivandre Paraboni

分类：自然语言处理

2022-06-24

从文本数据中推断出具有政治收费的信息是文本和作者级别的自然语言处理（NLP）的流行研究主题。近年来，对这种研究的研究是在伯特等变形金刚的代表性的帮助下进行的。尽管取得了很大的成功，但我们可能会询问是否通过将基于转换的模型与其他知识表示形式相结合，是否可以进一步改善结果。为了阐明这个问题，本工作描述了一系列实验，以比较英语和葡萄牙语中文本的政治推断的替代模型配置。结果表明，某些文本表示形式 - 特别是，BERT预训练的语言模型与句法依赖模型的联合使用可能胜过多个实验环境的替代方案，这是进一步研究异质文本表示的潜在强大案例在这些以及可能的其他NLP任务中。

translated by 谷歌翻译

在自然语言处理中，已证明使用预训练的语言模型可以在许多下游任务（例如情感分析，作者识别等）中获得最先进的结果。在这项工作中，我们解决了这些方法从文本中使用的人格分类。着眼于Myers-Briggs（MBTI）人格模型，我们描述了一系列实验，其中众所周知的双向编码器表示来自变形金刚（BERT）模型的模型进行微调以执行MBTI分类。我们的主要发现表明，当前方法在多种评估方案中基于词袋和静态单词嵌入方式大大优于众所周知的文本分类模型，并且通常在该领域的先前工作都优于先前的工作。

translated by 谷歌翻译